英文阅读不再盲目，英文水平稳步提升，你需要这个!

Original 荔枝欢颜枣妈和恺摩

2024-09-05

最近鸡娃圈最热的话题就是3月最后一天，教育部一纸官宣——教育部考试中心将不再承办剑桥通用英语五级考试（MSE）考试，一时间在在各个鸡娃群里激起千层浪。

在这个时机，我们为什么又提出英语测评？说起根源，我本身属于佛系鸡娃派的，一直在路上从不去考试，偶尔与小伙伴交流的时候，发现校内考试一个班30个100分，个个都能标准美音读绘本，但你不能说这些娃都在一个水平线上。

也不是为了竞争攀比，纯粹是为了给自己找一个路标，当我第一次听说剑桥托福这些让我望而生畏的考试之外，还有一些英语测评是可以跟美国的学生娃们同一个标准里横向比较阅读水平，当即产生了浓厚的兴趣。

于是在家里小朋友刚刚二年级可以拿着绘本自主阅读的时候，我给她做了第一次英语测评，在接下来的一年半里又做了三次，之后我对小朋友的英语阅读水平有了横向（同龄美国小朋友）与纵向（自身）的比较和认识。

真正开始关注英语测评，我逐渐了解到英语测评最大的价值不是排名和分数，而是它带来的指导意义。

经历过这段评测—提升的路线，今天跟大家聊聊“英语测评的前生今世”系列。

So，下面开始填第一个坑~今天文章内容分为五大块，从以下几个方面详细介绍：↓↓

① 为什么要做英语水平测试？
② 最常见最广泛的评测工具？区别是什么？
③ STAR测试评测哪些方面？
④ 如何解读评测报告？

⑤ 评测结果怎样帮助孩子的英文水平？

以下内容全部干货，需要细细咀嚼，为了让大家有耐心看下去枣妈在文中特备了“超级惊喜福利”，一定要仔细看！

为什么要做英语水平测试？

英文原版阅读越来越火，面对海量的原版英文书籍，很多家长经常会问——

“我家孩子今年X岁X年级了，有什么英文书推荐吗？”

如果是中文书，我相信不少妈妈随手都能甩出不少“x年级必读”书单，因为在语言不成为障碍的前提下，中文书单考虑的是 “思维认知”与年龄的匹配。

而英文书单需要解决的则是读者的阅读能力（语言水平）和书籍文本的阅读难度的匹配，也即“什么语言水平的娃，读什么难度的书”。

因此，英语测评最直接的目的就是解决匹配问题，便于“鸡饲料”的精准投喂。

研究表明，当书籍文本难度与读者阅读能力的相匹配，即读者可以理解75%左右的文本内容，这个难度既不会让读者因无法读懂而失去信心，也能对读者现有的能力提出挑战，激发阅读兴趣；此状态下的读者阅读能力提高最快。

同时，定期测试也可以追踪孩子的语言进步速度。考试不是检验努力的唯一标准，但它确实是对你努力成果的一个反馈。漫漫鸡娃路，家长需要一些回声来证明自己的付出，孩子需要一些成绩来反馈自己的努力。这个时候，我们需要在一种相对自信的状态下，听听客观考试对我们的评价反馈，结合自身，再去努力，去改善。

最常见最广泛的测试工具？

那么接下来的问题就是，有什么好的测评系统吗？我可不想动不动参加什么雅思托福剑桥KPF考试呀。放心，没有那么复杂。

首先，测评不同于考试的选拔性目的，它旨在对学生阅读的精准分级指导。

其次，测评过程方便快捷。

第三，测评结果的广泛认可与国际接轨。

认可度和权威度很高的两个分级阅读测评体系是Lexile蓝思和AR（Accelerated Reader）系统。

这两个系统已经给数十万的图书做了分级，几乎任何我们知道的英文原版书籍都可以在他们的官网上输入书名来查询其等级难度。还有鸡娃领袖们为众多流行读物做了各种分级的对照，下图便是其中一个。

无论上官网查，还是参照各种对照表，书籍的分级有了，“知己知彼”才算有了一半。下一步就是对读者阅读能力的测评了。

那么Lexile蓝思和AR（Accelerated Reader分级法）分别是怎么对阅读能力进行测评的呢？

我们先来大概了解下它们：

Lexile蓝思：

蓝思阅读测评体系是美国Metametircs教育公司受美国国家卫生研究院（National Institute of Health）资助，经过15年的研究开发出来的。在美国，蓝思阅读测评体系的使用机构遍布50个州，大约覆盖了美国全国学生人数的50%。

蓝思阅读测评体系是一种纯语言的阅读能力测评标准，忽略文化、年龄、认知的差异，以客观性著称，主要从语义难度（词频）、句法难度（句长）、结构指标（文本重复程度）、词汇指标（单词中元音、辅音、发音等）这四个维度来评测读者的阅读能力（LexileReadingMeasure）和书籍文本的阅读难度（LexileTextMeasure）。

AR（Accelerated Reader）：

Accelerated Reader分级法源自美国Renaissance Learning睿乐生，又称为Grade Equivalent Level(GEL)，评价读者的阅读水平等同于美国学生哪一年级第几个月阅读水平。

Accelerated Reader（简称AR）是一个题库，包含了18万多套针对分级读物和章节书的阅读理解题。

而提到AR，不得不说一下同属美国Renaissance Learning（睿乐生）旗下的Star Reading（以下简称为“STAR测试”）英语水平评测系统。

Star Reading测试的是孩子的阅读能力，AR测试的是对单本书的阅读理解程度。

美国三分之一的学校、英国近一半学校以及全球 96个国家5.2万所学校都在使用 Star Reading Assessments。终端学生用户达1800多万余人，积累了28亿真实学生数据，被认为是最权威的英语分级阅读和测试产品。

蓝思和Star都是权威标准测试，一定程度上其测试结果还可以相互转换，所以选择一种就可以了，毕竟这个结果是指导意义上的，不需要十分纠结。

蓝思值与AR、Star测试的区别：

从测评角度上，蓝思不考虑年龄、文化和认知的差异，侧重于词汇难度和句子长度。

AR 、STAR测试基于K-12分级阅读，以平均句子长度、平均字长、词汇使用年级、文章的单词数综合评分。个人感觉更适合学生群体，因此从二年级上学期，到三年级寒假，一年半年的时间，我给娃做了四次Star跟踪测试。

STAR英语水平测试评测哪些方面？

通常孩子英文阅读到一定程度，家长都想要给孩子做一份专业的水平测试，这时候只看书籍对应的蓝思值是不够的，家长通常会选择用STAR reading来让孩子做一份综合评估。

包含34个题目，共考察以下五个方面：

★ World Knowledge and Skills 单词知识和技能(Vocabulary)

★ Comprehension Strategies and

Constructing Meaning 理解策略和结构意义

★ Analyzing Literary Text 分析文学文本

★ Understanding Author’s Craft 理解作者的创作

★ Analyzing Argument and Evaluating Text 分析论点和评估文本

STAR测试过程很简单，34道选择题大概15-20分钟完成。测试系统采用计算机自适应方式（Computer Adaptive Test）出题，题目的难度随着答题正确率动态调整，正确率越高，后续题目越难；反之则题目会变简单。所以可以更准确地反映出孩子的真实水平。

官网有不同级别难度的范例可供参考，我截了几个图大家可以体验一下。

题目虽然有点多，好在选择题做起来还是很快的，看了下我家四次的测试时间最短13分钟，最长22分钟，还算是在专注时间范围内。不过做到后面她开始喊好难啊我蒙一个吧，嘴巴这么说，我看也是认真读题了的。

需要注意的是，既然是测评独立阅读水平的，那么测试过程中爸妈们千万要忍住，一定不要干预和出声提醒，哪怕看见小朋友正在犯一些很傻的错误，一定要记住我们测试的“初衷“啊。

如何解读测试报告

重头戏就是测试报告了。

有兴趣的妈妈可以跟随下面这份报告来看几个关键指标。

★ Test Time：即做测试所用时间。一般15~25分钟左右。如果低于15分钟，说明测试者可能没有用心、阅读水平过低或者过高；如果完成时间超过25分钟，则说明阅读速度偏慢。

★ Grade：测试者所在年级

★ 彩色条状图（Benchmark）：测试者阅读水平整体所处的位置，从左到右表示阅读能力越来越高。

红色Urgent Intervention（亟需干预）；黄色Intervention（需干预）蓝色 On Watch（需关注）绿色 At/Above Benchmark（标准以上）。

四种颜色区域，黑色小箭头代表被测试者的程度，该标记落在绿色区域，提示阅读水平在标准以上。

★ SS（Scaled Score）：根据测试者的阅读水平给出的阅读材料的难度系数分数越高则阅读水平越高，分值0~1400。

★ PR（Percentile Rank）：得分超过美国同年级学生的百分比

★ GE（Grade Equivalent）：最为常用的数值，评估阅读水平处于美国学生的年级数值，范围为K~12.9。

★ IRL（Instructional Reading Level）：建议阅读水平，范围为K~12.9，指内容理解&词汇掌握程度均达到80%以上对应的书籍难度。

★ Est. ORF（Estimated Oral Reading Fluency）: 每分钟能够正确阅读的文字量，该指标只出现在 1~4 年级的报告中。一般来说，初级阅读水平的人每分钟阅读100词以内，较为熟练的阅读者每分钟可达到150词以上。

★ ZPD（Zone of Proximal Development）：有趣而略有挑战的阅读区间，可以提高学生的阅读能力、培养与保持学生的阅读兴趣。报告中我们看到ZPD 3.2-4.9对应的蓝思指数为550-700L.

★ 各个细项（Domain Scores）：这里面所有的分值范围均是标准参考值(0~100)，一般来说，80+是可以接受的成绩。

家长普遍比较关心的是GE等级，需要注意的是，GE是美国学生的年级数值，有数据显示大概三分之二美国孩子的英文阅读水平低于他们年级要求，所以家长选书的主要依据应该是IRL，通常会比GE低0.3左右。

特别提示：

STAR测试报告解读，我们会再另外写一篇文章，手把手教大家看懂报告。（星标置顶公众号吧，就不会错过任何实用干货↓）

点击进入关注公众号and星标

插播今天的重磅惊喜福利：

是不是现在就想给孩子做一个STAR测试？枣妈粉丝福利来啦！！

枣妈给有意愿的参加测试的家长，免费赠送STAR测试一次（幼儿园小朋友无法测试，不要报名）共计100个名额，分两批进行。

报名方式如下：

扫码下单锁定名额

（需支付0.1元，介意勿拍）

拼手速！

注意：

下单时选项可选择1群or 2群，每群共50个名额，下单成功后扫码入微信群统一安排测试（详情见商品详情页）；1群和2群的测试间隔时间约1天；1群的名额拍完，选择2群名额来拍即可。

评测结果怎样帮助孩子提升英语水平？

有个别妈妈说Star测试不准，我觉得“不忘初心”科学专业解读，客观理性对待是最好的解决方案。阅读能力是一个动态的过程，从我家小朋友的四份报告来看，二年级入学的GE为2.1，与实际年级相当，那时她刚刚步入自主阅读的门槛，还在绘本阶段晃荡，阅读速度也只有53每分钟，我认为这个结果是符合她的实际情况的。

第二次测试是7个月之后，GE跳升至3.9。这期间她每天坚持RAZ朗读打卡并做后面的Quiz，寒假读了一套略超出她能力范围的初章（全靠故事有趣来吸引），阅读能力和速度（115字每分钟）提升是必须的，但是测试提升幅度有点虚高了，结合她口语和写作能力，显然是根基不牢的。但是也看出，花时间打卡和阅读，成效也是显著的。

再3个月后GE到了 4.4(速度131)，提速放缓，是一个正常数值。

到了三年级寒假GE值5.1，这个数值是否虚高呢？我的理解是，Fiction小说类，这个难度的她可以读，也正在读，非Nonfiction科学类的，显然她还远远达不到。除了阅读力之外，她的思想认知、口语写作等水平，都明显不能匹配。这时我会选择低一个年级的Nonfiction读物来平衡知识面，夯实基础。

而且，当GE值高出实际年级太多的时候，比如那些幼儿园就考KET的，选书的时候就必须考虑他的阅历、心智成熟度和思维认知能力了。

所以，Star测试结果绝不仅仅是一个GE值，它的细分项可以更真实地反应孩子全方位的英语能力，有些报告没有给到那么细致，有些则需要专业人士更加针对性解读。报告是死的，人是活的，家长合理期待、理性看待、正确对待才是好的态度。

继续滑动看下一个

枣妈和恺摩

向上滑动看下一个

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！

英文阅读不再盲目，英文水平稳步提升，你需要这个!

您可能也对以下帖子感兴趣

震撼！上海开放Google、Meta等国际平台，中国数字化迈出历史性一步！

战争烈度再升级，特朗普加征10%对华关税

特朗普称计划对中国商品征收25%的关税，外交部回应

从地方目标看全国！今年经济增长还是有很高要求

二姐李思林早知道李玟有轻生的念头，居然没一点防备措施！

生成图片，分享到微信朋友圈

英文阅读不再盲目，英文水平稳步提升，你需要这个!

您可能也对以下帖子感兴趣